Logo project

IF36-P24-TheWorld-TaylorsVersion

This is a school project for a Data Visualization course at UTT, France. It aims to create meaningful visualizations for a dataset of our choice ; here, we chose several datasets consisting of Spotify and Youtube data about popular songs.

Ce repo héberge un projet scolaire pour un cours de Visualisation de données à l’UTT. Il vise à créer des visulisations pertinentes pour un dataset de notre choix ; ici, nous avons choisi plusieurs datasets regroupant des données de Spotify et Youtube sur des musiques populaires.

Static Badge GitHub last commit


Content

Introduction ✨

L’équipe de projet The World (Taylor's Version) est composée de quatres personnes : Marielle CHARON, Kevin HERNANDEZ, Anouchka NEVEU et Amadou ISSAKA AMADOU. Le but de ce projet est de répondre à plusieurs questions sur le thème de la musique et plus précisement sur les platformes Spotify et Youtube grace à la visualisation de données. Le projet sera développé sous R.

Installation 🐙

git clone https://github.com/IF36-visualisation/projet-if36-p24-the-world-taylor-s-version.git

Vous pouvez également analyser les résultats seuls en ouvrant les fichiers .html qui rassemblent les visualisations.

Données 💡

Le dataset utilisé (Datasetfinal.csv) est un merge de deux datasets : Spotify and Youtube et Spotify songs. Le merge final pèse 6.55 MB et est sous format CSV. Il contient 3668 éléments. La clé qui a servi au merge est l’ID de la musique sur Spotify.

Les deux jeux de données contiennent des données datant de 2023 collectées depuis les API officielles de YouTube et Spotify. On a, notamment, les 10 musiques les plus populaires d’une variété d’artistes.

Le dataset complet possède 50 features, avant cleaning de celles pertinentes. Après cleaning, on a 33 features.
On regroupe les features sous ces catégories :

Catégorie Features associées
Informations générales artist, track_name, album, album_type, duration_ms, channel, description, track_album_release_date, …
Scores musicaux danceability, energy, key, loudness, acousticness, instrumentalness, liveness, valence, tempo
Popularité views, likes, comments, stream, track_popularity
Variables supplémentaires uri (Spotify ID), url_spotify, url_youtube, licensed, …

Les variables supplémentaires n’expliquent pas la donnée pour l’analyse, mais sont utilisées pour structurer le dataset.
Les features se répartissent selon plusieurs types : nominales (nom de l’artiste/musique/album, …), discrètes (tonalité) ou continues (scores musicaux).

Analyse 🖍

Dans ce projet, nous souhaitons répondre à plusieurs questions et suppositions. D’autres points pourraient encore emerger durant la manipulation des données afin de répondre à ces questions.

Contributeurs 👷

Marielle CHARON
Marielle CHARON

💻
Anouchka Neveu
Anouchka Neveu

💻
Kevin HERNANDEZ
Kevin HERNANDEZ

💻
Amadou ISSAKA AMADOU
Amadou ISSAKA AMADOU

💻
<b>
    <a href="https://www.npmjs.com/package/get-good-readme">File generated with get-good-readme module</a>
</b>